Détection de changements de distribution dans un flux de données : une approche supervisée

نویسندگان

  • Alexis Bondu
  • Marc Boullé
چکیده

Résumé. L’analyse de flux de données traite des données massives grâce à des algorithmes en ligne qui évitent le stockage exhaustif des données. La détection de changements dans la distribution d’un flux est une question importante dont les applications potentielles sont nombreuses. Dans cet article, la détection de changement est transposée en un problème d’apprentissage supervisé. Nous avons choisi d’utiliser la méthode de discrétisation supervisée MODL car celle-ci présente des propriétés intéressantes. Notre approche est comparée favorablement à une méthode de l’état-de-l’art sur des flux de données artificiels.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Détection de changements dans des flots de données qualitatives

Résumé. Pour mieux analyser et extraire de la connaissance de flots de données, des approches spécifiques ont été proposées ces dernières années. L’un des challenges auquel elles doivent faire face est la détection de changement dans les données. Alors que de plus en plus de données qualitatives sont générées, peu de travaux de recherche se sont intéressés à la détection de changement dans ce c...

متن کامل

Détection et Représentation des changements dans les sources de données RDF

Résumé : De nombreuses sources de données RDF sont en évolution constante que ce soit au niveau des données ou du vocabulaire utilisé (ontologie). De nombreuses tâches d’intégration sont impactées par ces modifications qu’il s’agisse de synchroniser des données locales avec une source de données externe ou d’effectuer des traitements plus complexes comme le liage ou la fusion de données. Dans c...

متن کامل

Apprentissage d'ensemble d'opérateurs de projection orthogonale pour la détection de nouveauté

Résumé. Dans ce papier, nous proposons une approche de détection de nouveauté fondée sur les opérateurs de projection orthogonale et l’idée de double bootstrap (bibootstrap). Notre approche appelée Random Subspace Novelty Detection Filter (RS-NDF), combine une technique de rééchantillonnage et l’idée d’apprentissage d’ensemble. RS-NDF est un ensemble de filtres NDF (Novelty Detection Filter), i...

متن کامل

Une approche de classification non supervisée basée sur la détection de singularités et la corrélation de séries temporelles pour la recherche d'états : application à un bioprocédé fed-batch

Résumé. Nous proposons dans cet article une méthode de clustering qui combine l’analyse dynamique et l’analyse statistique pour caractériser des états. Il s’agit d’une méthode de fouille de données qui travaille sur des ensembles de séries temporelles pour détecter des états; ces états représentent les informations les plus significatives du système. L’objectif de cette méthode non supervisée e...

متن کامل

Détection visuelle d'anomalies de conception

Résumé. De nos jours, les logiciels doivent être flexibles pour pouvoir accommoder d’éventuels changements. Les anomalies de conception introduites durant l’évolution du logiciel causent souvent des difficultés de maintenance. Cependant, la détection d’anomalies de conception n’est pas triviale. La détection manuelle est coûteuse en temps et en ressources, alors que la détection automatique gén...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2011